home *** CD-ROM | disk | FTP | other *** search
/ ftp.cs.arizona.edu / ftp.cs.arizona.edu.tar / ftp.cs.arizona.edu / tsql / doc / tsql.mail / 000035_csj@iesd.auc.dk _Sun Mar 14 23:44:40 1993.msg < prev    next >
Internet Message Format  |  1996-01-31  |  9KB

  1. Received: from iesd.auc.dk by optima.cs.arizona.edu (5.65c/15) via SMTP
  2.     id AA05212; Sun, 14 Mar 1993 15:44:17 MST
  3. Received: from yellow.iesd.auc.dk by iesd.auc.dk with SMTP id AA15068
  4.   (5.65c8/IDA-1.5/MD for <tsql@cs.arizona.edu>); Sun, 14 Mar 1993 23:44:40 +0100
  5. Date: Sun, 14 Mar 1993 23:44:40 +0100
  6. From: "Christian S. Jensen" <csj@iesd.auc.dk>
  7. Message-Id: <199303142244.AA15068@iesd.auc.dk>
  8. To: tsql@cs.arizona.edu
  9. Subject: The TSQL Benchmark initiative
  10.  
  11. Dear colleague,
  12.  
  13. In a recent posting to this mailing list, Rick Snodgrass formulated a
  14. vision of a comprehensive consensus benchmark for temporal query
  15. languages, the TSQL Benchmark.
  16.  
  17. I have decided to accept the invitation to coordinate the development
  18. of the first version of the TSQL Benchmark because I feel that the
  19. benchmark will become an important infra-structural component of
  20. temporal databases. As the coordinator, I will try to ensure that
  21. progress is being made and that the outcome is faithful to the initial
  22. intentions.
  23.  
  24. All that are interested in this topic are invited to participate. This
  25. mailing list will be the medium of communication.
  26.  
  27. Three tasks must be accomplished initially.
  28.  
  29. Task 1: Agree on a database schema.
  30. Task 2: Agree on an instance of the schema.
  31. Task 3: Agree on a suitable taxonomy for the benchmark queries.
  32.  
  33. These tasks will be addressed sequentially during the next weeks. When
  34. they are completed, the benchmark will be populated with queries.
  35.  
  36. Below, is my proposal for Task 1. The proposal also includes
  37. restrictions of the scope of the benchmark. Comments, suggestions,
  38. improvements, etc. are very welcome.
  39.  
  40. Best regards,
  41. Christian S. Jensen
  42. Aalborg University
  43.  
  44. \documentstyle[11pt]{article}
  45. %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
  46. % This paper is intended to evolve into the first version of the TSQL
  47. % benchmark.  
  48. % The purpose of this draft is to settle on a database schema for the
  49. % benchmark.
  50. % The purpose of the next draft is to settle on an instance for the
  51. % agreed-upon database schema.
  52. % The purpose of the following draft is then to define a taxonomy to
  53. % be used for categorizing the benchmark queries that will follow.
  54. %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
  55.  
  56. \addtolength{\textwidth}{1.485in}
  57. \setlength{\oddsidemargin}{.1in}
  58. \setlength{\evensidemargin}{.1in}
  59. \addtolength{\topmargin}{-.85in}
  60. \addtolength{\textheight}{1.8in}
  61.  
  62. \newenvironment{prog} { \begin{center} \begin{minipage}{3in}
  63. \begin{tabbing} nnnn\=nnnn\=nnnn\=nnnn\=nnnn\=nnnn\=nnnn\=\kill
  64. }{\end{tabbing} \end{minipage} \end{center}}
  65.  
  66. \long\def\comment#1{}
  67.  
  68. %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
  69. % PAPER START
  70. %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
  71.  
  72. \begin{document}
  73.  
  74. \title{\Large\bf The TSQL Benchmark \\ DRAFT} 
  75. \author{} 
  76. \date{March 14, 1993} 
  77. \maketitle
  78.  
  79. \section{Introduction}
  80.  
  81. The central goal of this document is to provide the temporal database
  82. community with a {\em comprehensive consensus benchmark} for temporal
  83. query languages which is {\em independent} of any existing language
  84. proposal.
  85.  
  86. This is not a performance benchmark, but a {\em semantic} benchmark
  87. which is intended to be an aid in evaluating the user-friendliness of
  88. proposals for temporal query languages. Thus, temporal query languages
  89. should ideally be able to express the benchmark queries both
  90. conveniently and naturally.
  91.  
  92. To obtain a consensus benchmark, all researchers in temporal databases
  93. will be invited to participate in this initiative, and each researcher
  94. that has contributed significantly will be a coauthor. The electronic
  95. mail distribution {\tt tsql@cs.arizona.edu} is used as the medium for
  96. discussing the benchmark and related issues.
  97.  
  98. As a consequence of the central goal above, no existing temporal data
  99. models are used or mentioned. The relation schemas of the benchmark
  100. are expressed as sets of attributes, with the temporal aspects being
  101. implicit (of course, specific temporal data models might add explicit
  102. temporal attributes). The contents of the relations are describe in
  103. natural language. The benchmark queries are also given only in natural
  104. language.
  105.  
  106. While the benchmark is not intended to constitute a metric for query
  107. language completeness, it should be comprehensive, to ensure that all
  108. aspects of query language design are covered. Within certain
  109. boundaries, discussed next, it is thus intended to contain all
  110. proposed queries that appear reasonable.
  111.  
  112. First, the benchmark is of a semantic nature---in its current form, it
  113. is not aimed at performance comparisons. The intention is to provide a
  114. foundation for comparing the descriptive and operational
  115. characteristics and capabilities of temporal query languages, not
  116. their performance characteristics. Properly extended with additional
  117. relation schemas and a variety of large instances, the benchmark can
  118. also be used for performance comparisons.
  119.  
  120. Second, a number of restrictions are imposed on which types of queries
  121. are admissible in this version of the benchmark, including the
  122. following.
  123.  
  124. \begin{itemize}
  125. \item{} Queries are restricted to valid time only. Transaction-time
  126.   related queries are not explored, and comprehensiveness is not
  127.   intended with respect to user-defined time.
  128.  
  129. \item{} Schema evolution and versioning are not considered.
  130.  
  131. \item{} Incompleteness is not considered. 
  132.  
  133. \item{} Recursive queries are not included.
  134.  
  135. \item{} Temporal reasoning is beyond the scope of this version of the
  136.   benchmark.
  137.  
  138. \item{} For simplicity, each relation is used only once in each query.
  139.  
  140. \item{} Queries involving aggregation facilities are not considered.
  141.  
  142. \item{} Only queries are included---updates are not considered.
  143. \end{itemize}
  144.  
  145. These advanced aspects are excluded solely for pragmatic reasons, and
  146. the exclusion is not meant to imply in any way that the aspects are
  147. not important. The restrictions simply represent an attempt to reduce
  148. the size of the initial benchmark to manageable proportions.
  149.  
  150. Finally, it is emphasized that this benchmark is merely the first in a
  151. sequence of ever-more comprehensive benchmarks. Later benchmarks may
  152. relax the above restrictions on the scope of comprehensiveness imposed
  153. on this benchmark.
  154.  
  155. \section{The Benchmark Database Schema}
  156.  
  157. \subsection{Criteria}
  158.  
  159. A suitable database schema for the benchmark should satisfy three
  160. criteria.
  161.  
  162. \begin{itemize}
  163. \item{} The schema should be simple. This will aid in making the
  164.   benchmark easy to understand. This criterion restricts the number of
  165.   relation schemas and the number of attributes of the individual
  166.   schemas. Additionally, the names of the relations and of the
  167.   attributes should be short, as they will be referenced repeatedly.
  168.  
  169.   When an extension is proposed, the benefits should be carefully
  170.   compared with the added complexity.
  171.  
  172. \item{} The schema should allow for comprehensiveness within the
  173.   chosen scope.Using the schema, it should be possible formulate
  174.   queries of all the types that appear reasonable.
  175.  
  176.   This indicates a need for at least two related relation schemas (for
  177.   natural join queries).
  178.  
  179. \item{} A schema that has already been used frequently is preferred
  180.   over a new schema. This guarantees that many existing queries can be
  181.   adapted easily to the benchmark.
  182. \end{itemize}
  183.  
  184. \subsection{The Proposed Schema}
  185.  
  186. The proposed database schema consists of two valid-time relation
  187. schemas, {\tt Emp} and {\tt Mgr}. In the terminology of the
  188. entity-relationship model, the first schema models an entity set, and
  189. the second a relationship set. They are defined as follows.
  190.  
  191. Relation {\tt Emp} records relationships between employees, salaries,
  192. and departments, and it contains the three attributes, {\tt Name},
  193. {\tt Salary}, and {\tt Dept}. Relation {\tt Mgr} records the
  194. association of employees, as managers, with departments, and it
  195. contains two attributes, {\tt Dept} and {\tt Manager}.
  196.  
  197. The relation schemas obey the following {\em snapshot} functional
  198. dependencies:
  199.  
  200. \begin{prog}
  201. For {\tt Emp}: \\
  202. \> {\tt Name} $\rightarrow$ {\tt Salary} \\
  203. \> {\tt Name} $\rightarrow$ {\tt Dept} \\
  204. For {\tt Mgr}: \\
  205. \> {\tt Dept} $\rightarrow$ {\tt Manager}
  206. \end{prog}
  207.  
  208. Note that both relation schemas are in snapshot Boyce-Codd normal
  209. form.
  210.  
  211. The attribute {\tt Manager} of {\tt Mgr} is a foreign key for the
  212. attribute {\tt Name} of {\tt Emp}. Thus, a tuple is allowed to exist
  213. in the {\tt Mgr} relation only if, for each non-empty snapshots of
  214. this tuple, the {\tt Manager} attribute value exists as a {\tt Name}
  215. value of some tuple in the simultaneous snapshot of the {\tt Emp}
  216. relation.
  217.  
  218. \end{document}